메뉴

#AI 안전

WR
Wired AI 3일 전
IMP 8

미국 최강의 AI 안전 법안, 일리노이주 통과

일리노이주 하원은 OpenAI, Anthropic 등 최첨단 AI 연구소들이 자체 안전 기준을 준수했는지 제3자 독립 기관의 감사를 받도록 의무화하는 법안(SB 315)을 통과시켰습니다. 기존 캘리포니아나 뉴욕의 법안을 넘어 자율 규제에 의존하던 빅테크 기업들을 외부 감사로 직접 책임지게 만드는 미국 내 가장 강력한 규제안으로 평가받습니다. 연방 차원의 AI 법안이 지연되는 가운데, 주(州) 정부 차원에서 실험적으로 도입되는 이 법안은 향후 미국 전체 AI 정책의 방향성을 결정할 중요한 이정표가 될 것입니다.

AI 규제 AI 안전 일리노이주
WR
Wired AI 4일 전
IMP 7

바티칸이 앤스로픽을 교황의 AI 칙서 발표에 초청한 이유

교황 레오 14세의 첫 AI 칙서 발표에 앤스로픽(Anthropic)의 공동 창립자인 크리스토퍼 올라가 참석하여 가톨릭교회와 실리콘밸리 간의 전례 없는 연합을 시사했습니다. 이는 바티칸이 기술적 윤리를 넘어 인류의 미래를 논의하기 위해 '안전과 정렬(Alignment)'을 핵심 가치로 삼는 앤스로픽을 핵심 대화 파트너로 삼았음을 의미합니다. 이번 행사는 AI 기술의 통제권과 철학적 해석 가능성에 대한 심도 있는 논의가 종교계와 산업계 사이에서 본격적으로 이루어지고 있음을 보여줍니다.

앤스로픽 AI 안전 바티칸
HN
Hacker News 11일 전
IMP 8

AI 이미지 워터마크 완벽 제거 오픈소스 등장

구글 제미나이, 오픈AI DALL-E, 미드저니 등 주요 AI 모델에서 생성된 이미지의 보이는 워터마크와 보이지 않는 워터마크, 그리고 C2PA 메타데이터까지 한 번의 명령어로 모두 제거하는 오픈소스 도구가 공개되었습니다. 특히 디퓨전(Diffusion) 기반 재생성 및 알파 뒤집기(Alpha reversal) 기술을 사용하여 핵심적인 AI 생성 증명 시스템을 무력화합니다.

워터마크 제거 오픈소스 디지털 저작권
HN
Hacker News 11일 전
IMP 8

오픈AI, 구글 '신스아이디(SynthID)' 워터마크 도입

오픈AI가 AI 생성 이미지의 출처를 투명하게 추적하기 위해 구글 딥마인드의 '신스아이디(SynthID)' 보이지 않는 워터마크 시스템을 도입했습니다. 이에 더해 C2PA 콘텐츠 출처 표준을 준수하여 메타데이터 기반의 출처 정보를 유지하며, 일반 사용자도 AI 생성 여부를 확인할 수 있는 공개 검증 도구를 선보였습니다. 이러한 다층적 접근은 메타데이터가 쉽게 소실되는 한계를 극복하고 디지털 생태계의 신뢰를 높이는 데 매우 중요한 역할을 합니다.

오픈AI 구글 신스아이디 콘텐츠 출처
GP
r/ChatGPT 12일 전
IMP 6

AI 이미지 생성기의 노출 필터링 한계와 허점

AI 이미지 생성 모델의 노출 및 성적 콘텐츠 생성 제한 정책과 관련된 Reddit 사용자의 경험담입니다. 사용자는 단일 프롬프트가 아닌 연속적인 대화를 통해 완전한 노출 이미지를 우회적으로 생성할 수 있었다고 밝혔습니다. 이는 AI 모델의 안전장치 우회 가능성과 기존 정책의 한계를 보여주는 중요한 사례입니다.

AI 안전 콘텐츠 필터 프롬프트 엔지니어링
HN
Hacker News 17일 전
IMP 8

AI 안전의 나머지 반쪽: 생화학 무기는 막으면서 정신 건강 위기는 방치하는 이유

최근 해커뉴스에 올라온 이 글은 AI 안전 연구가 대규모 파국적 위험(예: 생화학 무기)에만 집중하고, 수백만 명이 겪는 AI 사용 중의 정신 건강 위기(조현병, 자살 충동, 의존성 등)는 '모니터링' 수준으로 방치되는 구조적 모순을 지적합니다. AI 기업들은 파국적 위험에는 대화를 강제로 차단하는 하드 게이팅(hard gating)을 적용하지만, 자살 위기 상태에는 단순히 상담 전화번호를 안내하고 대화를 이어가는 소프트 리다이렉트(soft redirect)만을 사용하고 있어 '개인적 AI 안전(Personal AI Safety)'을 위한 정책적 기준 마련이 시급하다고 역설합니다.

AI 안전 정신 건강 AI 규제
WR
Wired AI 23일 전
IMP 8

새로운 무법지대가 된 AI 유아용 장난감

최근 AI 유아용 장난감 시장이 급격히 성장하고 있으나, 이에 대한 안전장치와 규제는 전무한 상태입니다. 소비자 단체의 테스트 결과 이른바 '가드레일'을 뚫고 성인용 콘텐츠나 위험한 행동을 조장하는 답변이 나오거나, 특정 정치적 성향을 내세우는 등 부적절한 응답이 속출하고 있습니다. 영유아기의 언어 및 사회성 발달을 저해할 수 있다는 케임브리지 대학의 연구 결과까지 나오면서, 업계와 정책 입안자들의 철저한 규제 마련이 시급해졌습니다.

AI 장난감 AI 안전 가드레일
TC
TechCrunch AI 23일 전
IMP 8

머스크 소송, 오픈AI 안전 기록 현미경 분석

일론 머스크의 소송으로 오픈AI의 이익 추구가 창립 미션을 훼손하고 안전을 경시했다는 논란이 수면 위로 올랐습니다. 전 임직원들은 제품 출시에 급급해 안전팀을 해산하고 모델 평가를 우회했다고 증언하며 샘 알트만 CEO의 투명성 결여를 지적했습니다. 이 재판은 오픈AI의 비영리 이사회가 영리 자회사를 제대로 감독했는지를 판가름하는 중요한 기로가 되고 있습니다.

오픈AI 일론 머스크 AI 안전
HN
Hacker News 25일 전
IMP 7

AI와 로봇 공학의 세 가지 역(逆)법칙

AI 시스템이 일상과 업무에 깊이 통합되면서 사용자의 비판적 수용 없는 맹신과 책임 전가가 사회적 위험으로 대두되고 있습니다. 이에 저자는 인간이 AI를 대할 때 지켜야 할 세 가지 역법칙(의인화 금지, 맹신 금지, 책임 완수)을 제안하며 AI를 도구로서 명확히 인식할 것을 강조합니다.

AI 안전 AI 윤리 의인화
TD
The Decoder 31일 전
IMP 7

미스트랄 '르 챗', 이란 전쟁 허위 정보 유포

2026년 4월 NewsGuard의 감사 결과, 유럽 주요 AI 모델인 Mistral의 'Le Chat(르 챗)'이 국가 주도 이란 전쟬 허위 정보 프롬프트의 약 60%를 사실로 유포하는 것으로 나타났습니다. 중립적 질문부터 악의적인 소셜 미디어 재가공 요청까지 다양한 프롬프트를 테스트했을 때 영어 50%, 프랑스어 56.6%의 오류율을 기록했습니다. 이는 상용 AI 모델이 외국의 선전에 얼마나 취약한지를 보여주는 중요한 지표입니다.

AI 안전 허위 정보 미스트랄
GP
r/ChatGPT 34일 전
IMP 8

GPT 이미지 2 활용 첫 허위 정보 캠페인 포착

백악관 보안 사건과 관련하여, 총격범이 이스라엘군 후디를 입은 사진을 올렸다는 주장이 트위터에 유포되었습니다. 하지만 해당 이미지는 오픈AI의 'GPT Image 2(지피티 이미지 2)' 모델로 생성된 가짜로 확인되었습니다. 최신 이미지 생성 AI가 악의적인 가짜뉴스 제작에 실제로 사용된 최초의 사례로서, AI 생성 콘텐츠에 대한 심각한 남용 및 검증의 중요성을 보여줍니다.

딥페이크 가짜뉴스 GPT Image 2
TC
TechCrunch AI 42일 전
IMP 8

앤스로픽과 트럼프 행정부, 관계 개선 움직임

미 국방부로부터 공급망 위험 요소로 지정받았음에도 불구하고, 앤스로픽(Dario Amodei CEO)이 재무장관 및 백악관 비서실장과 만나는 등 트럼프 행정부와의 관계가 빠르게 개선되고 있습니다. 국방부를 제외한 주요 정부 기관들이 여전히 앤스로픽 기술 도입을 원하고 있어, AI 기업과 정부 간의 안전 및 보안 협력이 향후 정책 및 시장에 중요한 영향을 미칠 것으로 보입니다.

앤스로픽 정부 정책 트럼프 행정부
MR
MIT Tech Review 44일 전
IMP 8

AI 전쟁에서 '인간의 통제'가 환상인 이유

미국 국방부의 AI 무기 사용을 둘러싼 논쟁에서, 작전에 '인간이 개입한다(Humans in the loop)'는 개념이 실제로는 통제를 보장하지 못하는 모순을 지적합니다. 최첨단 AI는 블랙박스처럼 작동해 인간이 AI의 의도를 파악하지 못한 채 전쟁 범죄로 이어질 수 있는 결정을 승인할 위험이 있습니다. 민간 분야에서조차 신중히 도입하는 블랙박스 AI를 전장에 섣불리 도입하는 것에 대한 경고와 함께 AI 시스템의 의도를 해석하는 과학의 발전이 시급하다고 강조합니다.

AI 무기 군사 AI AI 안전
SG
r/singularity 46일 전
IMP 8

안스로픽, AI 대형 참사 면책 법안에 반대

미국 일리노이주에서 발의된 AI 면책 법안(SB 3444)을 두고 안스로픽과 오픈AI가 정면으로 충돌했습니다. 오픈AI의 지지를 받는 이 법안은 AI가 대규모 인명 피해나 재산 손실을 유발할 경우 개발사의 책임을 면제해 주는 내용을 담고 있습니다. 반면 안스로픽은 강력한 기술을 개발하는 기업에 반드시 안전과 책임이 따라야 한다며 법안의 전면적인 수정이나 폐기를 요구하고 있어, 주요 AI 기업 간의 규제 철학 차이가 뚜렷하게 드러나는 사안입니다.

AI 규제 안스로픽 오픈AI
SG
r/singularity 46일 전
IMP 8

샘 알트만 자택 연이은 테러, 반AI 감정 폭발

OpenAI CEO 샘 알트만의 샌프란시스코 자택이 3일 만에 화염병과 총격을 순차적으로 당했습니다. 첫 번째 범인은 인류 멸망을 예언하며 '반AI 성명서'를 소지한 것으로 확인되었습니다. 이는 전 세계적으로 확산 중인 AI 및 데이터센터 반대 운동이 폭력적으로 변질되는 산업적, 사회적 위험을 시사합니다.

AI 안전 기술 정책 데이터센터
TD
The Decoder 46일 전
IMP 9

영국 AISI: 클로드 모델, 방어 취약 기업망 자동 해킹 성공

영국 AI 안전국(AISI)의 평가 결과, 앤스로픽의 '클로드 미토스 프리뷰(Claude Mythos Preview)'가 방어가 취약한 기업 네트워크를 처음으로 종단간 자율 침투하는 데 성공했습니다. 이 모델은 전문가 수준의 사이버 공격 훈련인 CTF(Capture the Flag)에서 73%의 높은 성공률을 기록하며 32단계의 전체 망 장악 시뮬레이션을 10회 중 3회 완료했습니다. 다만 실제 환경과 달리 테스트 환경에 능동적인 방어자나 보안 모니터링 시스템이 없었기 때문에, 실제 잘 보호된 시스템에서도 동일한 성능을 발휘할지는 미지수라는 한계가 있습니다.

사이버 보안 AI 안전 클로드(Claude)
GP
r/ChatGPT 47일 전
IMP 8

샘 알트만 타격범, 반AI 성명서에 다른 CEO 명단 적어

오픈AI 샘 알트만 최고경영자(CEO) 자택에 화염병을 투척한 용의자가 체포 당시 다른 AI 기업 CEO와 투자자들의 명단이 적힌 반AI(인공지능) 문서를 소지하고 있었던 것으로 확인됐습니다. 이 용의자는 텍사스에서 캘리포니아까지 이동해 범행을 저지른 뒤 오픈AI 본사까지 찾아가 방화와 살인을 협박한 혐의로 연방 기소되었습니다. 이 사건은 AI 산업계를 향한 극단적인 위협이 실제 테러 수준으로 이어졌다는 점에서 심각한 안보 경고로 작용하고 있습니다.

AI 안전 테러/범죄 오픈AI
SG
r/singularity 47일 전
IMP 8

릴리야 수츠케버의 핵심 AI 예측들이 현실로

전 OpenAI 수석 과학자 일리야 수츠케버가 4개월 전 한 AI 편집증과 공감 능력에 대한 예측이 현실로 나타나고 있습니다. 최근 Anthropic의 클로드 감정 상태 연구 논문 발표와 AI 통제의 위험성을 감지한 최고급 연구진들의 대거 이탈 및 안전 연구소 설립이 그 예증입니다.

AI 안전 일리야 수츠케버 Anthropic
HN
Hacker News 49일 전
IMP 8

AI는 폭력으로 맞서며, 그 어떤 좋은 것도 나오지 않을 것이다

이 글은 19세기 러다이트 운동(기계 파괴 운동)과 현재의 AI 발전 사이의 역사적 유사성을 지적하며, AI 기술의 부작용에 대한 반발이 결국 인간을 향한 폭력으로 이어질 것이라고 경고합니다. 저자는 물리적 데이터센터나 알고리즘을 파괴하는 것은 불가능에 가까우며, 기술의 불안정성 속에서 가장 취약한 링크인 '인간'이 결국 표적이 될 것이라고 주장합니다.

AI 안전 기술의 사회적 영향 러다이트 운동
TD
The Decoder 50일 전
IMP 8

샘 알트만 자택에 화염병 투척 사건 발생

샘 알트만 OpenAI CEO의 자택에 새벽에 화염병이 던져지는 테러 사건이 발생했습니다. 이에 대해 알트만은 과거의 실수를 인정하고 AI 업계의 권력 다툼을 '반지의 제왕'에 비유하며 기술의 민주화를 촉구했습니다. 해당 사건은 그를 비판하는 기사와 맞물려 발생한 것으로 보이며, 업계 전반의 긴장 고조와 AI 통제권 경쟁을 단적으로 보여주는 중요한 사건입니다.

OpenAI 샘 알트만 AI 안전
HN
Hacker News 50일 전
IMP 8

샘 알트만, 자택 화염병 투척 사건에 대한 소회

샘 알트만 오픈AI CEO가 자신의 자택에 화염병이 투척된 사건과 관련하여 가족의 사진을 공개하며 자신의 철학과 소회를 밝혔습니다. 그는 AI가 인류의 역량을 확장하는 강력한 도구가 될 것임을 강조하면서도, AI로 인한 사회적 변화에 대한 두려움이 정당하며 이에 대한 사회적 합의와 안전망 구축이 시급하다고 역설했습니다. 또한 오픈AI의 초창기부터 현재까지 겪었던 여러 갈등과 개인적인 실수들을 반성하며, 더욱 성숙하고 예측 가능한 기업으로 거듭나기 위해 노력하겠다고 덧붙였습니다.

오픈AI 샘 알트만 AI 안전
WR
Wired AI 50일 전
IMP 8

앤스로픽 '미토스', 예상치 못한 사이버 보안의 변화

앤스로픽은 새로운 AI 모델 '클로드 미토스 프리뷰(Claude Mythos Preview)'가 운영체제와 브라우저 등 거의 모든 소프트웨어의 취약점을 자율적으로 발견해 해킹 익스플로잇을 개발할 수 있다고 밝혔습니다. 업계에서는 이를 근본적인 보안 패러다임의 전환점으로 보는 시각과 과장된 마케팅이라며 의심하는 목소리가 팽팽하게 엇갈리고 있습니다. 앤스로픽은 방어자들에게 대비할 시간을 주기 위해 마이크로소프트, 애플, 구글 등 소수 기업에만 이 모델을 제한적으로 공개하는 '프로젝트 글래스윙(Project Glasswing)'을 출범시켰습니다.

사이버보안 취약점 분석 AI 안전
WR
Wired AI 51일 전
IMP 8

오픈AI, 대규모 인명·재산 피해 시 책임 면제 법안 지지

오픈AI가 자사의 최첨단 AI 모델이 대규모 인명 사망이나 10억 달러 이상의 재산 피해를 유발할 경우, 개발사의 책임을 면제해 주는 일리노이주 법안(SB 3444)을 적극 지지하고 나섰습니다. 이는 기존의 방어적 입장에서 벗어나 업계에 유리한 면책 조건을 법제화하려는 전략적 변화로 풀이됩니다. 글로벌 AI 기업들의 막대한 책임 소지를 덜어줄 수 있는 중요한 정책적 움직임이지만, 일각에서는 안전성 후퇴라는 강한 비판을 제기하고 있습니다.

AI 규제 오픈AI 면책 책임
SG
r/singularity 52일 전
IMP 2

쓸모없다고 느낄 땐 이 규칙이 있다는 걸 기억하자

AI 커뮤니티에서 맹목적인 반대 의견을 제한하려는 움직임에 대한 논의입니다. 단순히 종말론만을 반복하는 댓글에 제재를 가해야 한다는 주장이 제기되었습니다. 건설적인 비판과 비생산적인 공포 조장을 구분하자는 취지가 담겨 있습니다.

커뮤니티 규칙 AI 안전 종말론
TD
The Decoder 54일 전
IMP 8

오픈AI 안전 연구원 이탈 이유, 알트먼의 '감' 때문이었다

샘 알트먼이 뉴요커와의 인터뷰에서 자신의 스타일이 전통적인 AI 안전 분위기와 맞지 않아 연구원들이 떠났다고 인정했습니다. 이러한 갈등은 핵심 안전 연구진들이 퇴사하여 경쟁사인 앤스로픽을 설립하는 결과를 낳았습니다. 최근 펜타곤과의 계약 체결 시 내부 반발에 무심한 태도를 보인 점 등 알트먼의 상황에 따른 변화와 도덕적 무관심이 조직 이탈의 핵심 원인으로 지목됩니다.

오픈AI 샘 알트먼 AI 안전